万字详解YOLOv8网络结构Backbone/neck/head以及Conv、Bottleneck、C2f、SPPF、Detect等模块 |
您所在的位置:网站首页 › 骨干 意思 › 万字详解YOLOv8网络结构Backbone/neck/head以及Conv、Bottleneck、C2f、SPPF、Detect等模块 |
输入图像:输入图像的尺寸为 ( 640 × 640 × 3 ) (640 \times 640 \times 3) (640×640×3),其中640表示高度和宽度,3表示颜色通道(RGB)。 卷积块参数: 卷积核大小:3步长:2填充:1步长和填充的影响: 步长:步长为2意味着卷积核每次移动2个像素。这将输入图像的空间尺寸减半。填充:填充为1意味着在输入图像的每一边都增加一圈零,这有助于在卷积后保持空间维度。输出计算: 计算卷积操作输出尺寸 ( ( W o u t × H o u t ) ) ( (W_{out} \times H_{out}) ) ((Wout×Hout))的公式为: W o u t = ( W i n − 卷积核大小 + 2 × 填充 ) 步长 + 1 W_{out} = \frac{(W_{in} - \text{卷积核大小} + 2 \times \text{填充})}{\text{步长}} + 1 Wout=步长(Win−卷积核大小+2×填充)+1 H o u t = ( H i n − 卷积核大小 + 2 × 填充 ) 步长 + 1 H_{out} = \frac{(H_{in} - \text{卷积核大小} + 2 \times \text{填充})}{\text{步长}} + 1 Hout=步长(Hin−卷积核大小+2×填充)+1代入公式计算: W o u t = ( 640 − 3 + 2 × 1 ) 2 + 1 = 640 − 3 + 2 2 + 1 = 639 2 + 1 = 320 W_{out} = \frac{(640 - 3 + 2 \times 1)}{2} + 1 = \frac{640 - 3 + 2}{2} + 1 = \frac{639}{2} + 1 = 320 Wout=2(640−3+2×1)+1=2640−3+2+1=2639+1=320 H o u t = ( 640 − 3 + 2 × 1 ) 2 + 1 = 640 − 3 + 2 2 + 1 = 639 2 + 1 = 320 H_{out} = \frac{(640 - 3 + 2 \times 1)}{2} + 1 = \frac{640 - 3 + 2}{2} + 1 = \frac{639}{2} + 1 = 320 Hout=2(640−3+2×1)+1=2640−3+2+1=2639+1=320 因此,输出特征图的尺寸为 ( 320 × 320 ) (320 \times 320) (320×320)。 输出特征图: 卷积块产生的特征图尺寸为 ( 320 × 320 × C ) (320 \times 320 \times C) (320×320×C),其中 ( C ) (C) (C)是卷积层的输出通道数量,由使用的卷积核数量决定。例如,如果卷积层有64个卷积核,输出特征图的尺寸将为 ( 320 × 320 × 64 ) (320 \times 320 \times 64) (320×320×64)。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |